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摘要 : [目的 /意义 ] 近年 来 ,热点 论文 逐渐 受到 学 术 界 重视 ,为 数 不 多 的 研究 成 果 已 开始 探索 热点 论文 自 
身 的 特征 ,但 在 影响 因素 等 规律 方面 的 研究 工作 尚 不 充分 。[ 方法 “过程 ] 本 研究 利用 TF-IDF 算法 和 负 二 项 回 
归 模 型 ,试图 探究 热点 论文 的 分 布 特征 、 影 响 因素 、 时 间 窗 口 差 异 和 学 科 类 型 差异 。 [ 结果 /结论 ] 研究 结果 表 
明 ,热点 论文 的 分 布 特征 侧重 于 发 达 国家 、 知 名 研究 机 构 、 交 叉 学 科 和 权威 期 刊 ; 并 且 受 到 精炼 的 标题 、 国 家 间 
合作 、 研 究 型 产 出 、 开 放 获 取 、 高 影响 因子 期 刊 等 因素 影响 ;热点 论文 存在 时 间 窗 口 效应 ,甚至 改变 了 标题 、 摘 


Xm 开放 获取 、 期 刊 影响 因子 方面 均 存在 差异 。 


Kj 关键 词 : 热点 论文 分 布 特征 ”影响 因素 ”时间 窗口 学 科 差异 ” 负 二 项 回归 模型 
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性 成 果 " 背 景 下 的 高 被 引 论文 或 热点 论文 所 凸显 的 特 


2018 年 7 月 至 9 月 ,中共 中 央 办 公 厅 国务院 办 公 
厅 外 发 了 关于 深化 项 目 评审 .人 才 评 价 、 机 构 评 佑 改 
革 的 意见 》, 国 务 院 印 发 了 《关于 优化 科研 管理 提升 科 
研 绩效 若干 措施 的 通知 》, 人 社 部 办 公 厅 和 中 科 院 办 公 
厅 印 发 了 《关于 深化 自然 科学 研究 人 员 职 称 制度 改革 
的 指导 意见 (征求 意见 稿 )》, 分 别提 出 要 ”注重 标志 性 


征 及 影响 因素 ,将 很 快 成 为 学 术 界 关注 的 焦点 话题 。 
学 术 论文 是 科研 成 果 的 重要 载体 之 一 , 当前 学 术 
界 在 对 论文 的 影响 力 进行 评价 时 ,依然 广泛 采用 P. L. 
Gross! 4&1 1927 提出 的 “被 引 频次 ”指标 。 自 J. A. 
Virgo ”验证 了 被 引 频 次 与 科研 成 果 重要 性 的 正 相关 假 
设 之 后 ,H. F. Moed 等 ”指出 ,排除 不 正当 或 负面 引 
的 情形 ,被 引 频 次 越 高 ,往往 也 代表 学 术 论文 价值 越 


DS 


Cm 


RESP IE E 贡献 .影响 ,把 学 科 领 域 活跃 度 和 影响 力 
等 作为 重要 评价 指标 ” “建立 以 创新 质量 和 贡献 为 导 
向 的 绩效 评价 体系 ”和 “推行 代表 作 制 度 ,注重 成 果 的 
质量 贡献 .影响 ,将 自然 科学 研究 人 员 的 代表 性 成 果 
作为 职称 评审 的 重要 内 容 ”, 表 明 我 国 科研 管理 部 门 已 
经 深刻 地 认识 到 ,重视 学 术 界 标志 性 、 代 表 性 成 果 的 重 
要 意义 。 并 且 , 随 着 “ 双 一 流 大 学 ”建设 的 不 断 推进 ， 
已 有 众多 高 校 或 教师 将 ESI“ 高 被 引 论 文 ” (highly cited 
papers ) 或 热点 论文 ”hot papers) 作为 “标榜 "自身 学 

影响 力 的 方式 之 一 。 可 以 预见 ,探索 “标志 性 、 代 表 


Ko " 茶 一 特定 出 版 物 被 引用 的 频次 越 高 , 它 对 科学 进 
步 的 重要 性 就 越 大" 的 前 提 是 规范 引用 ”” ,这 一 前 提 不 
仅 为 被 引 频次 应 用 于 研究 评价 中 奠定 了 基础 ,也 表 
明 其 被 运用 到 研究 某 领域 具备 历史 根源 ”。 因 此 ,被 
引 频 次 可 以 用 来 评价 科研 成 果 的 重要 性 ,反映 学 术 论 
文 的 科研 共同 体 认同 价值 ”。 虽 然 有 学 者 证 实 了 
“ 睡 美人 文献 ” ”的 存在 ,但 其 依然 是 长 引文 时 间 窗 口 
下 基于 被 引 频次 的 评价 。 将 被 引 频 次 用 于 科研 评价 是 
和 否 存在 “固有 缺陷 ”“” ,学 术 界 虽 有 争议 ,但 不 可 否认 
的 是 ,被 引 频 次 依然 是 一 种 快速 有 效 的 评价 方法 ,逐渐 
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成 为 科学 计量 学 最 常用 的 评价 指标 之 一 ,并 推广 到 科 
技 政策 .学科 发 展 . 图 书 期 刊 .科研 人 员 等 的 评价 研 
究 ” ,从 而 得 到 学 术 界 的 普遍 认可 。 基 于 被 引 频 次 指 
标 下 的 “高 被 引 论文 "和 "热点 论文 ”, 可 以 在 一 定 程度 
上 衡量 标志 性 .代表 性 成 果 。 高 被 引 论 文 和 热点 论文 
的 定义 ,来 自 于 科 害 唯 安 官 方 网 站 "" ,高 被 引 论文 指 
在 10 年 内 发 表 的 论文 日 被 引用 数量 处 于 该 研究 领域 
( research field) 全 球 前 1% 之 列 ,热点 论文 则 是 近 两 年 
内 发 表 的 且 在 近 两 个 月 内 被 引用 次 数 进 入 该 研究 领域 
全 球 前 0.1% 之 列 的 论文 ,都 反映 了 所 属 领 域 中 具有 
突破 性 .最 有 影响 力 的 研究 工作 。 高 被 引 论文 引文 窗 
口 较 长 ,体现 被 引 频次 的 累积 过 程 。 相 比 之 下 ,热点 论 
文 则 是 科学 研究 的 最 新 发 现 和 研究 动向 ,具有 风向 标 
的 作用 ,反映 了 近 两 年 内 比较 受 关注 的 重要 研究 。 
因此 ,使 用 热点 论文 衡量 学 者 短期 内 具有 突破 意义 的 
PRERE RERE, 可 能 更 具 前 上 脆性。 学术 界 关于 
高 彼 引 论文 的 研究 工作 已 是 屡见不鲜 ,然而 基于 热点 
英 的 分 析 尚 不 多 见 。 因 此 ,探究 热点 论文 为 何 热 ? 


说 ,7 年 的 时 间 窗 则 比较 合适 '” 。 甚 至 有 学 者 研究 发 
现 ,由 于 物理 化 学 领域 所 使 用 的 实验 方法 非常 专业 , 涉 
及 的 理论 异常 复杂 ,在 短期 内 难以 衡量 该 领域 出 版 物 
的 真正 影响 ,并 且 其 所 提出 的 概念 需要 时 间 被 学 术 界 
“欣赏 ” ,因此 该 领域 中 如 果 有 研究 产 出 能 迅速 得 到 认 
可 ,应 该 得 益 于 该 领域 中 大 量 活 路 的 研究 人 员 "”。 此 
外 , 相 比 之 下 ,部 分 学 科 ( 如 生物 化 学 、 分 子 生物 学 、 免 
疫 学 和 细胞 生物 学 ) 期刊 (如 PRL、PNAS) 和 国家 (如 
美国 ) , 则 可 能 贡献 更 多 的 “hot papers" ^ 。 
2.1.2 热点 论文 影响 因素 方面 的 研究 ”关于 热点 论 
影响 因素 的 研究 尚 不 多 见 ,但 基于 被 引 频 次 影响 因 
素 的 文献 则 可 以 为 本 研究 提供 参考 。 学 术 界 大 多 在 讨 
论 论文 被 引 频 次 的 影响 因素 时 ,是 从 论文 自身 和 外 部 
言 息 来 考虑 的 ,本 研究 将 其 称 之 为 内 在 因素 和 外 在 因 
素 。 前 者 是 指 论文 自身 所 表达 的 信息 ,如 标题 、 摘 要 、 
合作 (作者 .国家 、 机 构 ) 文献 类 型 .是 否 获 得 基金 资 
HJ] 参考 文献 文章 长 度 、 发 文 年 份 等 ,而 后 者 则 是 指 刊 
载 期 刊 影响 因子 、 是 否 可 以 开放 获取 、 文 献 级 别 使 用 


研究 热点 论文 的 分 布 特征 .影响 因素 .时 间 窗 口 与 学 科 
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研究 回顾 与 述评 


2N 研究 回顾 

2P 以 热点 论文 为 主题 的 研究 ”关于 以 热点 论文 
闫 题 的 研究 工作 , 除 论证 了 其 在 被 引 方面 的 网 络 影 
响 s 还 涉及 热点 论文 的 文献 类 型 .时 间 窗 口 . 学 科 以 及 
期 科 、 国 家 等 方面 的 差异 。 热 点 论文 通常 表现 为 “被 引 
VES EE EDT I. soap DERE UR , fe UAR 
分 析 中 ,将 一 篇 论文 视 作 一 个 节点 ,因此 同时 诞生 的 节 
点 有 平等 的 机 会 被 连接 ,而 关于 科学 论文 吸引 力 的 实 
证 研究 结论 表明 ,热点 论文 可 以 比 其 他 同期 论文 获得 
更 多 的 链接 或 引用 "…“-”] 。 后 来 有 学 者 使 用 "节点 流行 
度 " 指 标 ,用 来 刻画 节点 在 区 域 中 影响 大 小 ,得 出 区 域 
影响 较 大 的 节点 吸引 连接 的 机 会 也 较 大 ,其 他 节点 也 
更 喜欢 连接 到 “流行 的 节点 ” ,证 实 了 与 其 他 同时 发 表 
的 论文 相 比 ,那些 比较 受 关注 论文 的 被 引用 次 数 更 多 ， 
并 且 后 续 的 研究 产 出 更 喜欢 引用 的 结论 "9 。 文 献 类 
型 在 热点 论文 方面 也 具有 差异 , 相 比 研究 类 文献 而 言 ， 
假如 综述 类 文献 更 易 成 为 热点 论文 ,可 能 表明 高 质量 
的 原创 性 研究 工作 较 少 ""。 时 间 窗 口 的 影响 也 不 可 
忽略 ,并 因 学 科 不 同 而 迎 异 。 一 份 出 版 物 的 真正 影响 
只 能 在 较 长 时 间 后 才能 确定 ,如 生物 医学 领域 和 多 学 
科 科 学 多 体现 为 3 年 的 时 间 窗 ,而 对 于 人 文 和 数学 来 
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E 以 及 学 科 数 量 等 外 在 信息 。 关 于 上 述 影响 因素 
方面 的 研究 工作 已 比较 常见 ,但 研究 结论 锭 异 。 

内 在 影响 因素 方面 ,如 标题 对 被 引 频 次 的 影响 , 吻 
除 期 刊 编 辑 部 对 标题 长 度 限 制 因素 外 ,大 致 有 3 种 
研究 结论 : 正 相 关 “” , 即 标题 越 长 被 引 频 次 也 就 越 
ZER” , 即 标题 长 度 与 被 引 频次 间 没 有 关系 ; 负 相 
X7 , 即 标题 越 短 被 引 频 次 也 就 越 多 。 摘 要 对 被 引 
频次 影响 的 研究 成 果 并 不 常见 ,有 学 者 采用 “ 弗 莱 士 易 
REJE” U5-? Flesch Reading Ease) 指标 ,对 摘要 可 读 性 
进行 分 析 ; 同 一 期 刊 的 论文 ,摘要 中 包含 被 频繁 使 用 词 
语 的 论文 得 到 的 评价 更 高 , 即 摘要 越 短 .使 用 更 常用 词 
语 ,可 能 更 容易 阅读 ,从 而 获得 更 多 的 引用 o PHF 
合作 主体 主要 包括 作者 、 国 家 和 机 构 3 个 方面 ,合作 可 
以 丰富 研究 思路 ,经 验 研究 证 实 合作 可 以 改变 科研 
绩效 ,提高 科学 产 出 的 质量 和 影响 力 “ ,但 是 W. 
Glinzel 教授 持 不 同 观点 ,其 认为 “相当 一 部 分 国际 合 
著 论 文 被 引 绩效 低 于 样本 平均 水 平 ”” “合作 总 能 保 
证 成 功 是 一 个 神话 ” ,还 有 学 者 指出 合作 规模 与 论 
文 被 引 频 次 之 间 存 在 一 定 的 不 确定 性 ” ,甚至 无 明显 
关联 ”。 学 术 论 文中 标注 的 参考 文献 ,构成 了 研究 的 
知识 基础 ,往往 一 篇 学 术 论 文 的 参考 文献 越 多 ,其 能 够 
获得 的 被 引 也 越 多 ”。 此 外 ,一 篇 文章 一 经 发 表 , 便 
会 成 为 后 续 研 究 的 参考 对 象 ,所 产 出 的 文献 类 型 在 被 
引 频 次 方面 也 应 该 存在 显著 差异 ,普遍 认为 综述 类 
(review) 论 文 的 篇 均 被 引 频 次 明显 高 于 研究 类 (arti- 
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cle) 论 文 ”。 不 过 也 存在 相反 结论 , 即 认为 研究 类 论 
文 是 高 影响 力 论文 的 主要 文献 类 型 ,具有 较 高 的 权威 
性 和 参考 价值 ,而 综述 类 论文 次 之 ”" 。 获 得 基金 资 
助 ,是 开展 科学 研究 的 重要 保障 ,可 以 改善 研究 条 件 、 
吸纳 研究 人 员 ,从 而 提高 研究 产 出 和 成 果 质 量 , 即 得 到 
资助 的 论文 成 果 , 在 发 表 后 的 被 引用 次 数 会 更 多 "|!。 
全 文 承载 了 文章 完整 信息 ,论文 长 度 即 页 码 数 "是 影 
响 被 引 频次 最 重要 的 因素 ,但 是 也 有 学 者 指出 论文 长 
度 与 被 引 频 次 并 无 关系 “ 。 文 献 平 均 被 引用 半衰期 


关 关 系 ” 。 虽 然 较 早 发 表 的 高 被 引 论文 使 用 次 数 较 
大 ,但 读者 们 更 倾向 于 使 用 较 新 的 文献 ” 。 另 外 ,不 
同学 科 领 域 的 读者 数量 ,文献 类 型 等 存在 的 差异 ， 
也 会 影响 被 引 频 次 。 
2.2 研究 述评 

通过 对 相关 研究 成 果 进 行 回顾 ,可 以 清晰 地 发 现 ， 
目前 鲜 有 研究 利用 定量 的 方法 对 热点 论文 的 分 布 特 
征 .影响 因素 等 问题 做 出 回答 。 此 外 , 纵 观 基于 被 引 频 
次 影响 因素 方面 的 研究 成 果 , 多 数 是 基于 固定 时 间 窗 


的 存在 ,早已 是 不 争 的 事实 ,大 致 约 为 5.6 47 BARS 
同 引 证 时 间 窗 口 59 也 会 影响 被 引 频次 。 


外 在 影响 因素 方面 ,如 期 刊 因素 对 论文 被 引 频 次 
影响 也 不 尽 相同 ,通常 认为 刊 发 在 高 影响 因子 期 刊 上 


的 学 术 论文 更 容易 得 到 关注 ,更 有 可 能 成 为 高 被 引 论 
D 但 也 有 学 者 发 现 大 多 数 情况 下 期 刊 影响 因子 
及 各 年 度 变化 对 被 引 频 次 并 未 产生 直接 的 影响 中 。 
述 菠 学 者 认为 利用 期 刊 影响 因子 评判 文章 是 “本 末 倒 
EE 举 “1 。 另 外 ,开放 获取 出 版 模式 的 发 展 ” ,不 同 
学 科 间 差异 所 :等 因素 也 会 影响 被 引 频次 。 近 年 来 ,有 
癌 逐 渐 将 基于 索引 数据 库 的 “文献 级 别 用 量 "( 使 用 
次 糊 ) 指 标 纳入 被 引 频 次 方面 的 研究 ,甚至 认为 可 以 将 
俩 用 次 数 作为 早期 表征 学 术 质量 的 又 一 指标 ,并且 
搬出 发 文 在 一 定时 间 内 较 高 的 使 用 次 数 可 以 预示 一 段 
till i pL. SERRE CL EDO C HESS 
TCR BR? IU XR ELBIERE A i FS 
Mis SUE DOOR 7 .相关 关系 较 弱 ”” un 


SN 


小 


LESS 


外 在 


口 或 单一 学 科 展 开 的 ,发 文 年 份 和 学 科 间 的 差异 使 得 
跨 学 科 、 时 间 序 列 上 的 比较 工作 变 得 异常 困难 ,研究 结 
论 也 近 异 。 本 研究 认为 ,时 间 窗 口 和 学 科 间 差异 可 能 
会 使 得 其 他 因素 作用 于 被 引 频 次 的 影响 机 制 发 生 改 
变 ,即将 时 间 、 学 科 因 素 纳 入 分 析 过 程 时 ,产生 一 种 调 
节 作 用 ,从 而 改变 其 他 因素 对 被 引 频 次 的 影响 。 因 此 
本 研究 将 重点 探讨 热点 论文 的 分 布 特征 .影响 因素 ,并 
对 不 同时 间 窗 口 和 学 科 间 差 异 做 出 比较 分 析 。 
3 ”研究 问题 与 研究 设计 
3.1 研究 问题 

热点 论文 能 够 快速 地 从 海量 的 科学 文献 中 脱 杀 而 
出 ,其 背后 可 能 具备 一 定 的 科学 计量 学 规律 ,本 文 试图 
对 此 展开 研究 工作 , 即 归 纳 热 点 论文 国家 、 机 构 、 学 科 、 
期 刊 分 布 特征 ,探寻 作用 于 热点 论文 的 内 在 和 外 在 影 


WAR ,并 对 不 同时 间 窗 口 ,不同 学科 类 型 下 的 差异 做 
出 分 析 ( 本 研究 的 逻辑 框架 见 图 1)。 


学 科 类 型 
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图 1 研究 逻辑 框架 


3.2 ”研究 设计 
3.2.1 
据 ,通过 Web of Science( 简称 WoS) 核心 合集 数据 库 获 
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数据 来 源 ”本 研究 基于 ES 下 的 热点 论文 数 。” 取 , 区 别 于 Scopus 数据 库 “TOP25 Hottest Articles " ^" 


和 www. Altmetric. com 的 “Top 100" Zit4g 5" 。 由 于 WoS 


Chinay iv EB 
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核心 合集 数据 库 中 只 记录 近 两 年 的 热点 论文 ,因此 将 ”上 表征 主题 ,计算 实 词 长 度 ; 然 后 利用 TF-IDF 算法 , 提 
发 文 时 间 限 定 在 2016 年 - 2018 年 ,文献 类 型 限定 为 ” 取出 每 篇 论文 标题 .摘要 中 的 具有 区 别 性 的 词汇 ,所 获 
" Article" fll" Review”, 不 限定 学 科 领 域 ,检索 时 间 为 : 得 的 词汇 长 度 代 表 每 篇 论文 标题 .摘要 的 区 别 词 长 度 。 
2018 年 9 月 2 日 。 检 索 共 获得 2 959 篇 热点 论文 , 剔 ”机构 合作 按照 作者 所 属 一 级 机 构 计 算 ,如 一 级 机 构 内 
除 字 段 不 完整 数据 ,保留 2 798 篇 文献 作为 研究 样本 。 部 单位 合作 ,只 记 一 个 机 构 。 依 据 钱学森 的 科学 技术 
3.2.2 变量 选取 与 定义 ”本 研究 基于 文献 内 在 和 外 ”体系 理论 ,所 有 的 科学 门类 都 可 以 划分 为 基础 科学 、 技 
在 因素 选取 研究 变量 ( 见 表 1) ,其 中 因 变 量 为 被 引 频 。 术科 学 和 工程 技术 三 个 层次 ,本 文 按照 刘 则 渊 教授 划 
次 , 自 变量 为 标题 实 词 长 度 \ 标 题 区 别 词 长 度 、 摘 要 实 。 分 标准 '” ,将 检索 到 的 数据 集中 2 637 篇 自然 科学 类 
WKE .摘要 区 别 词 长 度 、 作 者 合作 规模 、 国 家 合作 规 热点 论文 分 为 以 上 三 大 层次 ,需要 说 明 的 是 ,由 于 通常 
模 、 机 构 合作 规模 文献 类 型 .基金 资助 .引用 参考 文献 。 所 说 的 技术 科学 都 是 指 自 然 科学 领域 ,因而 本 文 对 数 
数论 文 长 度 、 发 文 年 份 . 开 放 获 取 情 况 、 论 文 使 用 次 据 集 中 余下 161 篇 社会 科学 类 热点 论文 没有 进行 三 个 
数学 科 数 .学 科 所 属 类 型 .期刊 影响 因子 。 对 部 分 研 ”层次 的 细 化 ,以 此 确定 所 属 学 科 类 型 。 按 照 [ST Web of 
究 变 量 的 处 理 过 程 做 出 说 明 :标题 .摘要 实 词 长 度 和 区 Knowledge 平台 的 《期 刊 引证 报告 》(Journal Citation Re- 
别 词 长 度 。 首 先 利 用 自然 语言 处 理 技术 将 文章 标题 、 ports) 所 公布 的 数据 ,获取 刊载 热点 论文 期 刊 上 年 度 影 
摘要 进行 分 局 和 停 用 词 处 理 ,剔除 无 实际 意义 的 虚词 ， ” 响 因 子 。 

保 较 具有 实际 含义 的 词汇 ,这 些 实 词 能 够 在 较 大 程度 


T 


ZI 表 1 各 变量 选取 与 定义 
O- 
N 被 引 频次 WoS 核心 合集 被 引 频次 tc 
C3 标题 实 词 长 度 利用 自然 语言 处 理 技术 得 到 标题 实 词 长 度 li num 
c9 标题 区 别 词 长 度 基于 TFJDF 算法 计算 标题 区 别 词 长 度 ti_tfidf 
CY 摘 要 实 记 长 度 利用 自然 语言 处 理 技术 得 到 摘要 实 间 长 度 icum 
(a 
e 摘要 区 别 词 长 度 基于 TF-IDF 算法 计算 摘要 区 别 词 长 度 ab. ifidf 
t6 作者 合作 规模 文章 作者 数量 € 
»- | 
Lh 国家 合作 规模 文章 作者 所 属国 家 数量 co, country 
» 
>< 机 构 合 作 规模 文章 作者 所 属 一 级 机 构 数量 co_organization 
文献 类 型 1 = "Article" ;0 = “ Review" dt 
30 基金 资助 1 = “获得 基金 资助 ;0 =“ 未 获得 基金 资助 ” fu 
34 引用 参考 文献 数 文章 所 引用 参考 文献 数量 nr 
a 论文 长 度 文章 总 页 数 pg 
13 发 文 年 份 py_2016 py. 2017 .py_2018 分 别 代表 2016 2017 2018 年 发 表 文章 py 
14 放 获取 情况 1 = “可 以 开放 获取 ";0 =* 不 可 以 开放 获取 ” * 
15 论文 使 HH 次 数 2013 年 至 今 文章 被 使 次 数 Usage 
16 学 科 数 WoS 数据 库 所 标注 的 WC 类 别 数量 wc, num 
17 学 科 所 属 类 型 wc. basic , wc, technical , wc, engineering , wc, social 分 别 代表 基础 科学 技术 科学 .工程 技术 和 社会 科学 wc, subject 
18 期 刊 影响 因子 发 文 年 份 前 一 年 Journal Citation Reports 对 应 的 期 刊 影响 因子 so, factor 
3.2.3. 模型 构建 ”为 了 研究 热点 论文 影响 因素 ,结合 ” 量 , 且 不 符合 正 态 分 布 ,呈现 离散 分 布 的 特点 。 对 此 ， 
本 研究 所 选择 的 指标 ,计量 模型 构建 如 下 : 常常 选择 泊 松 回归 进行 拟 合 ,并 且 要 求 其 方差 和 均值 


tc; 2 f (o, x ti. num,, œ, x ti 1fidf,, o x ab num, — 必须 相等 。 然 而 ,本 研究 中 由 于 样本 的 方差 大 于 均值 ， 
ai, X ab. tfidf,, as X co. au,, Qe X co country,, or X co_or- 两 者 不 相等 ,可 能 存在 过 度 离散 的 情形 ,不 符合 泊 松 回 
gaization, , o X dt;, e Xfu;, oy X nr;, e, X pg;, 0 X IHR SESR ^ ;然后 选择 负 二 项 回归 ,检验 通过 ,进而 选 


Dyi;, Q5 X0a;, Qa X usage;, Os X wc, num;, Qe X WC_ 择 零 膨胀 负 二 项 回归 ,没有 通过 检验 , 故 最 终 选 择 负 二 
subject; , o, X so. factor, ) 项 回归 。 本 研究 使 用 Statal4. 0 对 样本 数据 进行 负 二 


由 于 因 变 量 被 引 频 次 是 一 个 非 负 整数 的 计数 变 ”项 回归 分 析 。 


图 二 情报 三 作 
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4 实证 结果 分 析 


4.1 变量 描述 性 统计 和 相关 分 析 

由 描述 性 统计 指标 值 ( 见 表 2) 可 以 看 出 ,多 数 变 
量 标准 差 较 大 ,不 符合 正 态 分 布 ,呈现 离散 分 布 特点 ， 
且 部 分 变量 存在 0 值 , 显 然 不 满足 线性 相关 。 对 于 热 
点 论文 而 言 ,很 多 指标 存在 异常 大 的 极 差 ,可 以 预见 ， 
关于 热点 论文 被 引 频 次 的 影响 因素 可 能 不 存在 一 般 性 
规律 。 


in| 


表 2 各 变量 描述 性 统计 


变量 名 称 样本 量 ”均值 ”标准 差 极 小 值 ” 极 大 值 
te 2 798 90.81 167.1 2 4483 
ti num 2 798 9.360 3. 800 1 33 
ti. tfidf 2 798 1.480 1.560 0 11 
T™ ab_num 2 798 130.2 59.99 17 561 
e ab, tfidf 2 798 51.61 19.13 6 166 
co, au 2 798 26.82 164.7 1 3614 
|. co. country 2 798 3.360 6.840 1 105 
organization 2 798 9.730 35.71 1 571 
nr 2 798 106.4 235.5 0 8409 
| pg 2 798 18.28 43.50 1 1790 
| usage 2 798 136.1 218.1 0 2784 
.j wc. num 2 798 1.670 1.020 1 5 
( 2 798 17.48 18.96 0.290 187.0 


CbeabbU RR A 2C IER IR 
.之 由 于 变量 间 不 满足 线性 相关 , 故 使 用 Spearman 相 
美人 条 数 对 变量 间 进 行 检 验 , 检 验 结果 显示 ( 见 表 3), 绝 


多 数 变 量 通 过 了 相关 性 系数 显著 性 检验 ,表明 所 选 
的 变量 具有 一 定 的 影响 力 。 相 关 性 系数 处 于 合理 范 
围 ,日 方差 膨胀 因子 VIF 均 小 于 10 ,因此 并 不 认为 模型 
存在 严格 意义 上 的 多 重 共 线 性 ,可 以 进行 回归 分 析 。 
当 样 本 数据 量 较 大 时 ,绘制 热点 论文 被 引 频 次 与 
影响 因素 间 的 散 点 图 呈现 过 于 密集 的 特征 ,图 形 可 
解读 性 不 佳 , 因 此 ,为 克服 大 样本 数据 散 点 图 过 于 拥挤 
的 问题 , 本 研究 绘制 二 进 制 散 点 图 (Binned Scatter- 
plots) ^" ,即将 X 轴 变 量 分 成 数量 相等 的 组 ,计算 X 轴 
和 YY 轴 组 内 变量 的 均值 ,进而 绘制 其 二 进 制 散 点 图 和 
总 体 趋势 线 ,以 更 为 清晰 地 呈现 变量 间 的 关系 ( 见 图 
2) ,印证 前 面 所 提出 的 被 引 频次 与 各 影响 因素 之 间 可 
能 不 存在 一 般 性 规律 的 经 验 判断 。 
4.2. 热点 论文 分 布 特征 分 析 
图 3 分 别 呈 现 了 热点 论文 国家 、 机 构 .学 科 期刊 
分 布 特征 (排名 前 10 位 ) 。 其 中 国家 分 布 主要 集中 在 
发 达 国家 ,美国 的 确 向 世界 贡献 了 最 多 的 热点 论文 , 值 
得 一 提 的 是 ,中 国 在 这 一 方面 已 距 居 世界 第 2 位 ,但 美 
国 依 然 是 中 国 的 近 两 倍 。 大 学 是 热点 论文 的 主要 产生 
机 构 ,美国 斯 坦 福 大 学 位 列 第 1, 中国 科学 院 则 位 居 热 
点 论文 第 2 大 诞生 机 构 ,与 斯 坦 福 大 学 分 庭 抗 礼 。 热 
点 论文 的 学 科 分 布 集中 在 多 学 科 科 学 、 化 学 (多 学 
PH 、 医 学 等 交叉 学 科 领 域 。 在 期 刊 分 布 方面 ,产生 热 
点 论文 前 10 位 的 期 刊 集中 于 学 术 界 顶级 期 刊 , 也 印证 
了 前 述 高 影响 力 期 刊 更 容易 产生 热点 论文 的 观点 。 


大 
取 


c A3 变量 间 相 关 性 分 析 
te ti_num t tfidf  ab_num ab_tfidf co au co country pé carpant nr pg usage we num so factor 
i zation 
lc 1 
ti num 一 0. 138 ** 1 
ti. tfidf 0.111 ** 0.440 ** 1 
ab_num 0.002 0.264 ** 0.156 ** 1 
ab_tfidf 0.099 == 0.222 "* 0.233™ 0.873 == 1 
co_au 0.230 ** 0.179 "* 0.112 ** 0.313 ** 0.260 ** 1 
co_country 0.167 * 0.015 0.041 * * 0.162** 0.148 ** 0.522 ** 1 
co_organization 0.193 ** 0.072™™* 0.061 "* 0.272** 0.227™™ 0.736 ** 0.748 ** 1 
nr 0.057 "* —0.241*** —0.056 ** —0.083 ** 0.024  -0.234** -0.01 -0.119** 1 
pg 0.080 ** -0.160** -0.026 0.143 "* 0.174** -0.057*** 0.087 "* 0.059 "* Q.615 "* 1 
usage 0.536 "* —0.118*™ 0.120 ** —0.146 ** 0.009 0.0040 — -0.042** -0.112 ** 0.324 "* 0.084 ** 1 
wc, num —0. 151 ** 0.115 ** 0.053 ** —0. 114 ** —0. 066 =" —0. 189 *** —0. 120 ** —0.200 ** 0.065 ** -0.002 0.065 ** 1 
so. factor "* 0.075 ** 0.087 ** 0.136 "* 0.355 "* 0.166 "* 0.256"*  -0.018 -0.012 0.374** -0.297 *** 1 


iE: px0.10, *p«0.05, ”p<0.01 
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4.3 热点 论文 影响 因素 分 析 
4.3.1 内 在 影响 因素 方 
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如 表 4 所 示 , 广 泛 使 用 区 


别 性 词汇 的 标题 要 比 摘要 更 易 成 为 热点 论文 ,模型 
(1) -模型 (4) 表 明 , 相 比 摘 要 的 大 段 文 字 , 标 题 短小 
精怪 ,往往 可 以 迅速 抓 住 读 者 眼球 , 即 精炼 上 且 区 别 于 大 
众 研 究 的 标题 ,使 得 文章 发 表 之 后 能 够 获得 更 多 的 被 
引 。 跨 越 国 界 的 科研 合作 往往 能 够 形成 高 质量 成 果 ， 
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模型 (1) -模型 (4) 表 明 , 作 者 合作 、 机 构 合作 在 热点 


论文 方面 影响 不 显著 ,而 国家 间 合 作 具 有 明显 的 正 癌 
拉力 ,通常 可 以 提高 科研 产 出 的 质量 ,诱发 研究 热点 。 


研究 类 文献 表征 所 产 出 的 热点 论 


文具 备 较 高 的 学 术 价 


值 , 相 比 综述 类 文献 ,热点 论文 主要 体现 为 研究 类 文 
献 , 彩 显 研 究 成 果 的 创新 性 。 热 点 论文 里 的 基金 资助 
论文 获得 更 高 被 引 的 可 能 性 反而 较 低 ,模型 (3 ) 表明 
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基金 资助 的 论文 对 其 获得 高 被 引 具 有 人 负 向 影响 ,可 能 表 4 热点 论文 影响 因素 模型 分 析 

与 文章 在 短期 引文 窗口 背景 下 无 法 获得 长 远 评 价 有 模型 (1) ”模型 (2) ”模型 (3) ”模型 (4) 
Ko 广泛 的 知识 基础 对 热点 论文 的 影响 关系 不 明显 ， te te te te 
参考 文献 数量 越 多 ,可 以 在 一 定 意义 上 表明 该 方向 上 ti num -0.032 8 ** -0.0235 ** -0.035 4 *** -0.025 9 *** 


(74.84)  (-4.060) (-4.93)  (-4.53) 


H 


的 知识 基础 越 丰富 。 但 模型 (1) -模型 (4) 表 明 ,参考 


ee ttfidf 0.070 8 *** 0.0664*** 0.0680*** 0.065 5 
si ` ^ RU (4.89) (5.58) (4.69) (5.57) 
幅 和 热点 论文 间 影 响 关 系 存在 不 确定 性 ,模型 (1) - dicun -0.000 445 -0.001 52* -0.000559 -0.001 57* 
模型 (4) 的 “文章 长 度 " 系数 均 未 通过 显著 性 检验 , 且 (-0.439) (-1.89)  (-0.53)  (-1.91) 
系数 有 正 有 人 负 , 表 明 很 难 有 适用 于 任何 场合 的 结论 。 ab_tfidf 0.00221 0.00432* 0.00221 — 0.00434* 
热点 论文 依然 存在 时 间 窗 口 的 规律 ,模型 (2)、 模 型 (0.77) (1.92) (0.79) (1.95) 
(4) efl] 2016 4g 2017 435 HE 2018 年 的 热点 论文 更 gui 0.000266 0.000334 0.000250 0.000 305 
易 获得 高 被 引 ,上 且 2016 年 显著 易于 2017 年 , 即 热点 论 
加 Bo aai 0.0180%  0.0179** 0.0154* — 0.0158 ** 
文 也 受 时 间 窗 口 规律 影响 。 (2.00 (2.33) (175) (2.08) 
4x92 外 在 影响 因素 方 如 表 4 所 示 , 开 放 获 取 成 co organization -0.000 520 -0.000 871 -0.000121 -0.000 499 
郑 纺 生 热 点 论文 高 被 引 的 非常 显著 因素 ,并 且 使 用 次 (-0.27  (-0.8)  (-0.0))  (-0.32) 
数 基 构成 正 向 影响 , 即 一 篇 获得 高 被 引 的 论文 ,一 定 要 di 0.184» » — 0.2001** — 0.208** — 0.216** 
著者 广泛 地 使 用 和 阅读 ,而 开放 获取 则 为 之 提供 了 (24) GID (297) (4.20) 
i AI ,模型 (1) -模型 (4) 均 证 实 了 上 述 观 点 。 被 fu -0.0822 -0.0146 -0.129% « -0.0677 
(-L24)  (-0.30 (-1.97) (-1.42) 


iE deo pH AT FU C CERT HR S IE CAE 


nr 0.000129 0.000262  7.17e-05 0.000 212 
得 高 被 引 ,模型 (1) 模型 (3 ) 表 明 ,学 科 数 对 于 热点 (0.47) (1.26) (0.27) (1.04) 
Ye 多 获得 更 高 被 引 具 有 负 向 影响 , 当 一 本 期 刊 涉猎 过 pg 0.000696  -6.12e-05 0.00104 0.000 221 
ARUM, RT RE I A 5e Mr tti XE VERE S i e X (0.54) — (-0.06) (0.83) (0.23) 
宁 科 学 领域 通常 可 以 使 热点 论文 获得 更 多 引用 , 相 zT T P 
比 福 会 科学 ,不 同学 科 领 域 中 ,技术 科学 最 容易 促使 热 p NEAR 
上 敬文 继续 获得 高 被 引 AERIS AI TEER AE nd hine i 
有 蜂蜡 ,凸显 技术 科学 的 学 和 影响 力 。 高 影响 因子 基 IEEE ME. 
天 本 容易 推动 热点 论文 被 引用 ,往往 高 影响 力 期 刊 备 ” EB eL e 
受 侈 术 界 关注 ,具有 风向 标的 作用 。 因 此 发 表 在 高 影 ijs 0.001 85*** 0.001 16*** 0.001 90 *** 0.001 18 *** 
响 力 期 刊 上 的 论文 ,也 极 易 在 整个 学 术 界 形成 “追随 效 (12.35) (11.66) — (12.81) (12.18) 
应 ”, 从 而 加 速 热 点 论文 获得 高 被 引 。 wc, num -0.0526** -0.0292 -0.0537* -0.0316 
4.4 ”热点 论文 时 间 窗口 差异 分 析 人 

文献 回顾 和 前 述 研究 结论 均 表明 时 间 窗 口 对 热点 ici e RE 
论文 具有 明显 影响 。 通 过 跨 年 份 比较 ,可 以 考察 哪些 | HM 
因素 对 热点 论文 的 影响 会 随 着 时 间 变 化 而 凸显 或 消亡 7T pen 
( 见 表 5)。 人 研究 表明 : 越 早 发 表 的 文章 ,其 精炼 的 标题 pe ee 
往往 成 为 比 摘要 更 能 推动 被 引 的 因素 ,而 新 近 发 表 的 (4. 89) (6.08) 
文章 ,使 用 有 区 别 于 其 他 研究 的 词汇 撰写 摘要 , 则 显得 so. factor 0.0135 0.0131*% 0.0126™* 0.0123 ** 
尤为 重要 ;科研 合作 作用 于 热点 论文 方面 的 影响 不 明 (10.70) (12.65) (9.73) (11.64) 
显 ,国家 合作 可 能 有 一 定 影响 ,但 作者 合作 和 机 构 合作 iod CU a 
并 无 显著 影响 ;文献 类 型 和 是 否 收 到 基金 资助 .参考 广 Wr MN CMS 


LL -14 809.66 -14 115.04 -14 781.595 —14 080.364 


献 数 量 文章 长 度 等 因素 在 时 间 窗 口上 的 规律 不 明显 ; 
开放 获取 对 推动 发 表 较 早 的 热点 论文 继续 获得 高 被 引 
的 贡献 更 大 ,而 使 用 量 指标 则 对 新 近 发 表 论 文 的 作用 


N 2 798 2 798 2 798 2 798 


TE: " ps0. 10, * p«0.05, ""p«0.01; 1&5 7g Z Sii ERE 
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更 加 明显 ;被 赋予 学 科 标签 数量 多 的 期 刊 ,其 对 热点 论 


文 的 影响 也 不 稳定 ;此 外 , 相 比 当年 发 表 和 前 年 发 表 ， 


上 年 发 表 的 热点 论文 在 学 科 分 类 方 1 


引 所 体现 的 差异 和 


影响 更 加 突出 , 即 发 表 后 第 二 年 更 易 促 使 热点 论文 获 


得 高 被 引 ;期 


刊 影响 因子 始终 是 正 向 影响 ,但 是 时 间 窗 


口 规律 并 不 明显 。 
表 5 热点 论文 时 间 窗 口 差异 分 析 
模型 (5) 模型 (6) 模型 (7) 
tc tc te 
ti_num -0.032 5 *** -0.026 1 *** -0.004 75 
( 43.32) ( -3.79) ( -0.35) 
ti. tfidf 0.062 0 *** 0.072 9 *** 0.067 6 ** 
(2.99) (4.69) (2.14) 
ab. num 0.002 24 —0.002 57 *** -0.007 53 *** 
(1.46) ( —3.76) ( 74.26) 
T ab. dfidf —0. 006 56 0.006 91 *** 0.017 8 ** 
( 71.53) (3.24) (2.98) 
0.000 703 0. 000 493 -1.94e -05 
(1.02) (1.26) ( -0.04) 
0. 009 72 0.019 0 ** 0.027 3 
(0.66) (2.08) (1.11) 
rganization 0. 000 269 — 0.002 60 —0.004 73 
(0.10) ( 21.13) ( 20.52) 
dt 0.066 1 0.260 *** 0.231 
(0.62) (4.94) (1.56) 
fu -0.089 2 -0.104 ** 0.052 9 
( 70.85) (-L97) (0.53) 
nr 2.49e - 05 0. 000 256 — 0. 000 342 
(0.06) (1.11) ( 0.39) 
pg 0. 000 975 — 0. 000 225 0.004 56 
(0.48) ( 20.17) (1.13) 
oa 0.414 *** 0.248 "** 0.080 0 
(4.82) (5.29) (0.71) 
— usage 0.000 919 *** 0.001 35 *** 0.002 02 *** 
(7.39) (11.64) (2.99) 
wc, num 0.044 0 -0.064 3 *** -0.056 4 
(0.97) ( -3.25) ( 21.33) 
wc, basic 0.439 *** 0.634 *** 0.361 *** 
(3.06) (6.54) (2.91) 
wc. technical 0.448 *** 0.676 *** 0.408 "** 
(3.13) (6.98) (3.24) 
wc, engineering 0.395 *"* 0.545 ""* 0.367 ** 
(2.66) (5.13) (2.25) 
80. factor 0.014 5 *** 0.010 7 *e* 0.0179 v 
(7.42) (8.96) (6.63) 
cons 4.042 *** 3.086 *** 1,839 *** 
(22.99) (25.07) (9.29) 
LL -4 845.504 9 -7 501.150 8 -1 676.151 9 
N 831 1500 467 


注 : 模 型 (5) (6) (7) 分 别 为 2016 ,2017 ,2018 4 


2017 .py_2018 ) 分 析 结 果 ; 


为 Z 统计 量 值 


E(py_2016 \py_ 
*px0.10, *px0.05, “p<0.01; 括 号 内 


4.5 热点 论文 学 科 类 型 差异 分 析 

学 科 类 型 差异 依然 是 科学 计量 学 领域 不 可 忽视 的 
问题 ,对 热点 论文 也 具有 规律 性 影响 。 通 过 跨 学 科比 
较 , 可 以 考察 各 影响 因素 在 各 不 同类 型 学 科 间 的 差异 
( 见 表 6) 。 即 :基础 科学 .技术 科学 论文 标题 对 热点 论 
文 获得 高 被 引 的 作用 大 于 摘要 ,而 社会 科学 热点 论文 
则 比较 得 益 于 摘要 的 影响 ,工程 技术 热点 论文 受 标题 、 
摘要 影响 方面 均 不 显著 ;基础 科学 领域 热点 论文 的 科 
研 合作 作用 均 不 显著 ,而 技术 科学 具有 较 少 的 作者 和 
机 构 合作 、 较 多 的 国家 合作 ,工程 技术 体现 较 多 的 机 构 
合作 、 较 少 的 作者 合作 ,社会 科学 则 具有 较 少 国际 合作 
的 特点 ;研究 类 文献 在 基础 科学 .技术 科学 领域 更 易 受 
到 关注 ,而 在 工程 技术 和 社会 科学 领域 则 不 明显 ;热点 
论文 是 否 受到 基金 资助 ,在 学 科 差 异 方面 也 不 显著 ;与 
前 述 分 析 类 似 ,参考 文献 数量 对 各 领域 热点 论文 均 不 
起 显著 影响 ;文章 长 度 对 技术 科学 的 影响 较 大 ,对 其 他 
学 科 影响 不 显著 ;时 间 窗 口 对 所 有 学 科 热 点 论文 的 影 
响 均 十 分 明显 , 且 越 早 发 表 的 热点 论文 , 越 易 获得 被 
引 , 这 与 前 述 研 究 结 论 相同 ;开放 获取 、 期 刊 影响 因子 
对 于 基础 科学 .技术 科学 .社会 科学 热点 论文 具有 正身 
作用 ,工程 技术 领域 不 显著 ;使 用 量 对 各 学 科 均 有 显著 


Ir 
pA UE o 


5 结论 和 讨论 


(1) 热 点 论文 普遍 具有 精炼 的 标题 ,注重 国家 间 
合作 、 多 数 属于 研究 型 产 出 ` 可 以 开放 获取 、 刊 载 在 高 
影响 因子 期 刊 上 等 特征 。 发 达 国家 的 确 贡 献 了 众多 热 
点 论文 ,中 国 也 具有 重要 影响 力 。 热 点 论文 往往 聚焦 
于 多 学 科 科 学 等 交叉 领域 。 

(2) 热 点 论文 同 其 他 类 型 文献 相似 ,也 存在 时 间 
窗口 效应 ,时 间 窗 口 同时 作用 于 其 他 因素 对 热点 论文 
产生 影响 。 时 间 窗 口 改 变 了 标题 摘要、 开放 获取 等 因 
素 影响 热点 论文 的 具体 轨迹 , 即 发 文 较 早 的 热点 论文 ， 
标题 .开放 获取 的 作用 越 大 ,而 新 近 发 表 的 热点 论文 ， 
摘要 往往 受到 关注 ,开放 获取 作用 并 不 突出 。 

(3) 学 科 间 差异 对 热点 论文 的 影响 也 非常 重要 ， 
技术 科学 领域 热点 论文 最 容易 获得 高 被 引 , 其 次 是 基 
础 科学 工程 技术 .社会 科学 。 不 同学 科 和 领域 ,在 标题 、 
摘要 、 科 研 合作 文献 类 型 .开放 获取 期刊 影响 力 等 方 
面 均 存 在 差异 。 

(4) 本 研究 仅 就 热点 论文 自身 的 特征 和 规律 进行 
分 析 ,并 未 将 热点 论文 与 其 他 类 型 文献 进行 比较 。 热 
点 论文 里 可 能 存在 “县 花 一 现 " 式 文献 ,因此 针对 热点 
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表 6 热点 论文 学 科 间 差异 分 析 


模型 (8) 模型 (9) 模型 (10) ”模型 (11) 
te te tc tc 
li num -0.0266*** -0.0234** 0.0118 -0.010 5 
(-3.65  (-2.82) (0.86) ( -0.65) 
ti_tfidf 0.054 7*** 0.0815*** -0.00132 -0.006 83 
(2.73) (5.25) (-0.00)  (-0.14) 
ab num -0.002 23 ** -0.000812  -0.00354 -0.008 54 *** 
(-2.17)  (-L01) (-149) (-3.73) 
ab, tfidf 0.00350 — 0.00313 0.00938  0.0195*** 
(1.11) (1.22) (1.35) (3.45) 
co, au -0.000 813 -0.000 408*™* -0.0845** — 0.0090 
(-1.23) (-2.4)) (-3.71) (1.50) 
co country -0.008 33  0.0220** -9.00e-05 -0.126 ** 
( -0.35) (2.59) (-0.00)  (-2.34) 
"eo organization 0.0130 — -0.00278* 0.0979* 0.0184 
> (1.49) ( -1.80) (1.92) (0.56) 
s dt 0.209 *** 0.206 ** 0. 163 0.067 6 
er (4.13) (2.40) (0.85) (0.30) 
O n -0.101 0.00392 -0.0275 -0.0228 
(=) ( -1.41) (0.05) (-0.200 | (-0.22) 
m = 5.80e-05 0.000168 0.000512  -0.000 438 
e (0.33) (0.40) (0.41) ( -0.44) 
过 pg 0.000496 0.006 99**  —0.00438 0.000 875 
e (0.51) (2.14) ( -0.42) (0.21) 
CN 2016 1.842 ** — 1.909** — 1.708** 1.709 ** 
> (21.51) (22.00) (9.93) (10.90) 
om 1.143** — LI7I** — 1.042** — 0.92] "* 
© (14.85) (15.63) (7.14) (7.08) 
E oa 0.356 *** 0.163 *** -0.046 3 0. 260 ** 
go (5.17) (3.05) ( -0.29) (2.20) 


h 


0.001 10 *** 0.002 48 *** 0.000 822 ** 0.002 08 * 


Q usage 


(8.85) (6.43) (3.10) (1.86) 
so, factor 0.0107 ** .0.0137** -0.0138 0.046 4 *** 
(6.69) (10.03) ( -0.32) (3.64) 
.cons 2. 659 *** 2.157 *** 2.368 *** 2.088 ** 
(20.77) (15.58) (6.91) (6.75) 
LL —7 016.401 1 -5 606.962 4 —713.622 98 -638.401 79 
N 1 358 1 117 162 161 


注 : 模 型 (8) (9) (10) (11) 分 别 为 基础 科学 ,技术 科学 .工程 技 
术 社会 科学 (we_basic , we, technical , wc, engineering , wc, social ) 分 析 


结果 ; ”p<0.10, " p«0.05, ps0.01; 括 号 内 为 Z 统 计量 值 


论文 影响 因素 的 研究 结论 ,是否 在 其 他 类 型 文献 中 具 

有 相似 或 截然 不 同 的 规律 , 尚 不 可 知 ,留待 后 续 研 究 进 

行 探 索 。 
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“Abstract; [ Purpose/significance | In recent years, hot papers have been paid more and more attention by acade- 
mi&.) A few research results have begun to explore the characteristics of hot papers themselves, but the research on influen- 
cing factors and other laws is still insufficient. | Method/process] Based on this, this study uses TF-IDF algorithm and 
negative binomial regression model to explore the distribution characteristics, influencing factors, time window differences 
and disciplines type differences of hot papers. [ Result/conclusion | The results show that the distribution characteristics 
of hot papers focus on developed countries, well-known research institutions, interdisciplinary and authoritative journals, 
and are influenced by refined titles, inter-country cooperation, research output, open access, high-impact factor journals 
and other factors; hot papers have time window effect, and even change the titles, abstracts, open access and other fac- 
tors. The differences among disciplines have an impact on hot papers, and there are differences in title, abstract, scientif- 
ic research cooperation, literature type, open access and journal impact factors. 
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